import scrapy


class BaiduSpider(scrapy.Spider):
    # 爬虫的名字 运行爬虫的时候 使用的值
    name = "baidu"
    # 允许访问的域名
    allowed_domains = ["www.baidu.com"]
    # 起始的URL 指第一次访问的域名
    start_urls = ["http://www.baidu.com/"]

    # 是执行了start_urls之后 执行的方法 方法的response参数 就是返回的那个对象
    # 相当于 response = urllib.request.urlopen(url)
    # 或者 response = requests.get()
    def parse(self, response):
        # 返回字符串
        # print(response.text)

        # 返回二进制数据
        # print(response.body)

        # xpath() 解析response
        # extract() 提取data属性值
        print(response.xpath('//input[@id="su"]/@value')[0].extract())

        pass
